在现代自治堆栈中,预测模块对于在其他移动代理的存在下计划动作至关重要。但是,预测模块的失败会误导下游规划师做出不安全的决定。确实,轨迹预测任务固有的高度不确定性可确保这种错误预测经常发生。由于需要提高自动驾驶汽车的安全而不受损害其性能的需求,我们开发了一个概率运行时监视器,该监视器检测到何时发生“有害”预测故障,即与任务相关的失败检测器。我们通过将轨迹预测错误传播到计划成本来推理其对AV的影响来实现这一目标。此外,我们的检测器还配备了假阳性和假阴性速率的性能度量,并允许进行无数据校准。在我们的实验中,我们将检测器与其他各种检测器进行了比较,发现我们的检测器在接收器操作员特征曲线下具有最高的面积。
translated by 谷歌翻译
我们的动机是将一个机器人任务相对于另一个机器人任务的复杂性进行比较的问题。为此,我们定义了一个简化的概念,该概念正式为以下直觉形式化:任务1减少到任务2,如果我们可以有效地将解决任务2的任何策略转换为解决任务的策略1.我们进一步定义了相对量度的定量度量给定机器人任意两个任务之间的复杂性。我们证明了我们还原概念(例如反射性,传递性和反对称性)和相对复杂性度量(例如非负和单调性)的有用特性。此外,我们提出了用于估计相对复杂度度量的实用算法。我们说明了使用(i)示例可以分析降低的示例进行比较机器人任务的框架,以及(ii)强化学习示例,其中提议的算法可以估计任务之间的相对复杂性。
translated by 谷歌翻译
我们的目标是执行分销(OOD)检测,即,检测机器人在从不同分布的环境中运行而不是用于训练机器人的环境。我们可能大致正确(PAC)--Bayes理论,以便在培训分布上培训一项保证性能的保证的政策。我们对OOD检测的关键思想依赖于以下直觉:违反测试环境的性能,提供了机器人运营的证据。我们通过基于p值和浓度不平等来使其通过统计技术来形式化。由此产生的方法(i)提供了保证的置信信心界限,包括探测器的假正负率和(ii)的误报和假负率的界限仅是任务驱动和敏感,仅适用于影响机器人性能的变化。我们在使用具有不熟悉的形状或姿势的对象以及在不熟悉的环境(包括风扰动和不同的障碍密度)中使用具有不熟悉的形状或姿势的对象和姿势的无人驾驶障碍物的仿真任务的模拟和硬件中的方法。我们的例子表明我们可以在少数季度试验中执行任务驱动的OOD检测。与基线的比较也展示了我们的方法的优势,以提供统计保证并对任务 - 无关分配转变不敏感。
translated by 谷歌翻译
We present NusaCrowd, a collaborative initiative to collect and unite existing resources for Indonesian languages, including opening access to previously non-public resources. Through this initiative, we have has brought together 137 datasets and 117 standardized data loaders. The quality of the datasets has been assessed manually and automatically, and their effectiveness has been demonstrated in multiple experiments. NusaCrowd's data collection enables the creation of the first zero-shot benchmarks for natural language understanding and generation in Indonesian and its local languages. Furthermore, NusaCrowd brings the creation of the first multilingual automatic speech recognition benchmark in Indonesian and its local languages. Our work is intended to help advance natural language processing research in under-represented languages.
translated by 谷歌翻译
We study the capabilities of speech processing systems trained simply to predict large amounts of transcripts of audio on the internet. When scaled to 680,000 hours of multilingual and multitask supervision, the resulting models generalize well to standard benchmarks and are often competitive with prior fully supervised results but in a zero-shot transfer setting without the need for any fine-tuning. When compared to humans, the models approach their accuracy and robustness. We are releasing models and inference code to serve as a foundation for further work on robust speech processing.
translated by 谷歌翻译
高斯工艺(GPS)是贝叶斯非参数模型,由于其准确性和天然不确定性定量(UQ),因此在各种应用中流行。调整GP超参数对于确保预测准确性和不确定性的有效性至关重要。独特地估计多个超参数,例如Matern内核也可能是一个重大挑战。此外,大规模数据集中的培训GPS是一个高度活跃的研究领域:传统的最大似然超参数训练需要二次记忆以形成协方差矩阵并具有立方训练的复杂性。为了解决可扩展的超参数调整问题,我们提出了一种新型算法,该算法估算了Matern内核中的平滑度和长度尺度参数,以提高所得预测不确定性的鲁棒性。使用与超参数估计算法MUYGPS提供的计算框架中的合并预测算法相似的新型损失函数,我们在数值实验中证明了高度可伸缩性,同时保持了高度可伸缩性。
translated by 谷歌翻译
本文介绍了我们对SMM4H 2022共享任务的提交,内容涉及自我报告的亲密伴侣暴力在Twitter上(英语)。这项任务的目的是准确确定给定推文的内容是否证明了某人报告自己的亲密伴侣暴力经历。提交的系统是五个罗伯塔模型组成的合奏,每个模型各自在验证数据集上由各自的F1分数加权。该系统的性能比基线要好13%,并且是该共享任务的总体性能最佳系统。
translated by 谷歌翻译
在立体声视觉中,自相似或平淡的区域可能使得很难匹配两个图像之间的补丁。基于主动立体声的方法通过在场景上投射伪随机模式来减轻此问题,以便可以在没有歧义的情况下识别图像对的每个贴片。但是,投影模式显着改变了图像的外观。如果这种模式充当对抗性噪声的一种形式,则可能对基于深度学习的方法的性能产生负面影响,这现在是密集立体声视觉的事实上的标准。在本文中,我们提出了Active-Passive Simstereo数据集和相应的基准测试,以评估立体声匹配算法的被动立体声和活动立体声图像之间的性能差距。使用提出的基准测试和额外的消融研究,我们表明特征提取和匹配的模块选择了20个选择的基于深度学习的立体声匹配方法,可以推广到主动立体声,没有问题。但是,由于二十个体系结构(ACVNet,Cascadestereo和Stereonet)中三个的差异细化模块由于对输入图像的外观的依赖而受到主动立体声模式的负面影响。
translated by 谷歌翻译
尽管自我监督的学习技术通常用于通过建模多种观点来从未标记的数据中挖掘隐性知识,但尚不清楚如何在复杂且不一致的环境中执行有效的表示学习。为此,我们提出了一种方法,特别是一致性和互补网络(Coconet),该方法利用了严格的全局视图一致性和局部跨视图互补性,以维护正则化,从而从多个视图中全面学习表示形式。在全球阶段,我们认为关键知识在观点之间隐含地共享,并增强编码器以从数据中捕获此类知识可以提高学习表示表示的可区分性。因此,保留多种观点的全球一致性可确保获得常识。 Coconet通过利用基于广义切成薄片的Wasserstein距离利用有效的差异度量测量来对齐视图的概率分布。最后,在本地阶段,我们提出了一个启发式互补性因素,该因素是跨观看歧视性知识的,它指导编码者不仅要学习视图的可辨别性,而且还学习跨视图互补信息。从理论上讲,我们提供了我们提出的椰子的基于信息理论的分析。从经验上讲,为了研究我们方法的改善,我们进行了足够的实验验证,这表明椰子的表现优于最先进的自我监督方法,这证明了这种隐含的一致性和互补性可以增强正则化的能力潜在表示的可区分性。
translated by 谷歌翻译
立体声视觉最新发展的主要重点是如何在被动立体声视觉中获得准确的密集差异图。与被动立体声相比,主动视觉系统可以更准确地估计致密差异。但是,子像素准确的差异估计仍然是一个空的问题,几乎没有得到关注。在本文中,我们提出了一种新的学习策略,以训练神经网络,以估计半密集的主动立体声视觉的高质量子像素差异图。关键的见解是,如果神经网络能够共同学习如何完善差异图,同时使像素不足以纠正差异估计值,那么它们的准确性就可以翻倍。我们的方法基于贝叶斯建模,在该模型中,经过验证和无效的像素由它们的随机属性定义,从而使模型可以学习如何自行选择哪些像素值得关注。使用主动立体声数据集(例如Active-Passive Simstereo),我们证明了所提出的方法优于当前最新的活动立体声模型。我们还证明,所提出的方法与米德尔伯里数据集上的最新被动立体声模型进行了优惠比较。
translated by 谷歌翻译